误差曲面error surface

也叫做loss surface(损失曲面)

指的是当讲模型的所有参数看作坐标轴,把模型在这些参数下的损失值看作高度,所形成的一个多维曲面。

通常来说,

我们优化的目标就是在error surface中寻找最低点,也就是损失最小的参数组合

一个光滑的error surface容易找到最优解,而一个具有很多鞍点Saddle Point/局部最低点 local minima的图的优化算法则容易被卡住,可能需要更加复杂的优化器(如Adam优化器RMSProp优化器

梯度下降gradient descent就是沿着error surface上最陡的下坡反向走,直到到达最低点。